Recherche d'informations dans la blogosphère : Défis et premières évaluations

نویسندگان

  • Claire Fautsch
  • Jacques Savoy
چکیده

This paper describes the main retrieval problems when facing with blogs. Using the classical tf idf vector-space model together with three probabilistic and one statistical language model, we evaluate them using a TREC test-collections composed of 100 topics. Using two performance measures, we show that ignoring a stemming approach results in a better performance than other indexing strategies (light or Porter’s stemmer). MOTS-CLES : Blogosphère, Domaine spécifique, Evaluation, Modèle probabiliste, TREC.

برای دانلود متن کامل این مقاله و بیش از 32 میلیون مقاله دیگر ابتدا ثبت نام کنید

ثبت نام

اگر عضو سایت هستید لطفا وارد حساب کاربری خود شوید

منابع مشابه

Architecture des bases d'Images Généralistes Organisées en Clusters

Résumer. Les développements actuels, en matière de technologie liée à l’information numérique, ont permis l’acquisition et le stockage d’une quantité importante d’information, ce qui a engendré la nécessité d'élaborer des systèmes permettant la gestion de ces données (plus particulièrement les bases de données images). La recherche d’images par le contenu tente de répondre à ces besoins en se b...

متن کامل

Traduction automatique de termes biomédicaux pour la recherche d'information interlingue

RÉSUMÉ. Dans cet article, nous présentons une méthode de traduction automatique de termes biomédicaux. Cette méthode s’appuie sur une technique originale d’apprentissage supervisé de règles de réécriture et sur l’utilisation de modèles de langue. Les évaluations présentées montrent que notre technique est très performante et permet de traduire à partir et à destination de n’importe quelle langu...

متن کامل

Regroupement sémantique de définitions en espagnol

De nos jours, l’utilisation de l’Internet pour la recherche de définitions est de plus en plus importante. Wikipédia et Medline sont devenu les sites les plus consultés de la Web. Or, il existe un énorme nombre de définitions qui sont parfois inaccessibles aux utilisateurs. Celles-ci peuvent se trouver dans des sites non encyclopédiques ou dans de documents divers. Dans cette perspective nous a...

متن کامل

LOGUS : compréhension de l'oral spontané. Présentation et évaluation des bases formelles de LOGUS

RÉSUMÉ. Dans les systèmes de dialogue oral Homme-Machine, la compréhension de la parole spontanée est un problème difficile qui requiert des méthodes d’analyse robustes. La plupart des systèmes sont destinés à des actions très spécifiques : la compréhension repose sur la détection de mots ou segments clefs pour remplir les différents champs de requêtes prédéterminées. LOGUS, le système de compr...

متن کامل

Violence du langage dans l’œuvre dramatique de Samuel Beckett : la quête du néant

L’homme beckettien représente grosso modo sur la scène de théâtre des années cinquante le spectacle de souffrance physique et de désintégration totale du sujet qui est le fait d’un trauma et d’un complexe plus profonds, celui du vide de matières scéniques et du mal fondamental qu’on traiterait d’existentiel. En d’autres termes, le mal est dans ce monde quelque chose d’inné chez l’être humain. C...

متن کامل

ذخیره در منابع من


  با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید

برای دانلود متن کامل این مقاله و بیش از 32 میلیون مقاله دیگر ابتدا ثبت نام کنید

ثبت نام

اگر عضو سایت هستید لطفا وارد حساب کاربری خود شوید

عنوان ژورنال:

دوره   شماره 

صفحات  -

تاریخ انتشار 2008